Публикации с тэгом "Links (web browser)"
СТАТЬЯ Дайджест ссылок и материалов #18
Очередная порция ссылок и материалов. Key Sites MSDN Home MSDN Dev Centers MSDN Library Quick Links MSDN Flash Free Signup and Archive MSDN Subscription Signup "How Do I?" Videos Bytes by MSDN MSDN Events and Webcasts MSDN Virtual Labs Channel 9 Tech.Ed Online Azure tools: Windows Azure SDK Download Windows Azure Platform Trial Azure Developer Center Tools for .Net Tools for Node.JS Tools for java Tools for PHP Tools for other languages Azure Support Forums Azure training: Azure Developer Center...
СТАТЬЯ Подходы к извлечению данных из веб-ресурсов
В предыдущей статье мы рассмотрели основные понятия и термины в рамках технологии Data Mining. Сегодня более детально остановимся на Web Mining и подходах к извлечению данных из веб-ресурсов. Web Mining — это процесс извлечения данных из веб-ресурсов, который, как правило, имеет больше практическую составляющую нежели теоретическую. Основная цель Web Mining — это сбор данных (парсинг) с последующим сохранением в нужном формате. Фактически, задача сводится к написанию HTML парсеров, и как раз об ...
СТАТЬЯ Очищаем веб-страницы от информационного шума
Предыдущие мои статьи были, в основном, о теоретической части Data Mining, сегодня хочу рассказать о практическом примере, который используется в кандидаткой диссертации (в связи с этим данный пример на данном этапе развития нельзя считать полноценным работающим проектом, но прототипом его считать можно). Будем очищать веб-страницы от «информационного шума». Так в чем же проблема? Проблема заключается в том, что добрая половина веб-сайтов содержит кучу ненужной информации на страницах — так назы...
СТАТЬЯ Web page content analysis with "SmartBrowser"
Overview Smart Browser is a software for loading only the most relevant for user page content excluding advertisement, design features, links etc. This software is a result of scientific researches and now it is under development. This version is a preview for demonstrating the main idea and determining the future research directions. Architecture The Smart Browser architecture consists with several main modules: Graphic user interface (GUI). Module for slicing web pages into information blocks....